• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "생성형 AI 업무 혁신"에 대한 통합 검색 내용이 325개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
엔비디아, “생성형 AI 통해 다양한 분야서 HPC 활용 연구 가속화 지원”
엔비디아가 생성형 AI를 통해 HPC(고성능 컴퓨팅) 작업을 가속화하며 코드 생성, 기상, 유전학, 재료 과학 분야의 연구를 지원하고 있다고 밝혔다. 생성형 AI는 국가와 기업 연구소에서 비즈니스와 과학을 위한 HPC를 가속화하며 기반을 다지고 있다. 샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 시도를 하고 있다. 여러 국립 연구소의 연구진이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있다. 샌디아 국립 연구소의 연구진들은 검색 증강 생성(RAG) 기술을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있다. 이들은 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여주고 있다. 과학자들이 평가하게 될 RAG 옵션 중에는 네모 리트리버(NeMo Retriever)와 같은 클라우드 기반 서비스도 있다.     이러한 모델 조정과 RAG를 통한 코파일럿 구축은 시작에 불과하다. 연구진들은 궁극적으로 기후, 생물학, 재료 과학과 같은 분야의 과학 데이터로 훈련된 파운데이션 모델의 활용을 목표로 하고 있다. 일기 예보 분야의 연구원과 기업들은 기상, 기후 연구를 위한 서비스와 소프트웨어 세트인 엔비디아 어스-2(Earth-2)의 생성형 AI 모델인 코디프(CorrDiff)를 채택하고 있다. 코디프는 기존 대기 모델의 25km 해상도를 2km까지 조정할 수 있다. 또한, 결합할 수 있는 예측 수를 100배 이상 확장해 예측 신뢰도를 높일 수 있다. 자체 소형 위성 네트워크에서 데이터를 수집하는 기업인 스파이어(Spire)의 톰 고완(Tom Gowan) 머신러닝 및 모델링 책임자는 “생성형 AI를 통해 더 빠르고 정확한 예보가 가능해지고 있다”고 전했다. 스위스에 본사를 둔 메테오매틱스(Meteomatics)는 최근 자사의 일기 예보 사업에도 엔비디아의 생성형 AI 플랫폼을 사용할 계획이라고 발표했다. 메테오매틱스의 마틴 펜글러(Martin Fengler) CEO는 “엔비디아와의 협력은 에너지 기업들이 날씨 변동에 대한 빠르고 정확한 인사이트를 통해 재생 에너지 운영을 극대화하고 수익성을 높이는 데 도움이 될 것”이라고 말했다. 마이크로소프트는 생성형 AI로 재료 과학 분야의 작업을 가속화하는 연구를 진행했다. 마이크로소프트의 매터젠(MatterGen) 모델은 원하는 특성을 나타내는 새롭고 안정적인 물질을 생성한다. 이 접근 방식을 통해 화학, 자기, 전자, 기계 등의 기타 원하는 특성을 지정할 수 있다. 마이크로소프트 연구팀은 엔비디아 A100 GPU를 사용해 애저(Azure) AI 인프라에서 매터젠을 훈련시켰으며, 카본3D(Carbon3D)와 같은 기업은 상업용 3D 프린팅 작업에서 재료 과학에 생성형 AI를 적용하며 기회를 찾고 있다. 엔비디아는 “이는 연구자들이 생성형 AI를 통해 HPC와 과학 분야에서 할 수 있는 일의 시작에 불과하다”면서, “현재 사용 가능한 엔비디아 H200 텐서 코어 GPU와 곧 출시될 엔비디아 블랙웰(Blackwell) 아키텍처 GPU는 새로운 차원의 작업을 실현시킬 것”이라고 기대했다.
작성일 : 2024-05-16
마이크로소프트, ‘업무동향지표 2024’ 통해 기업의 AI 활용 동향 소개
마이크로소프트가 링크드인과 함께 제작한 연례 보고서 ‘Work Trend Index 2024(업무동향지표)’를 발표하면서, AI(인공지능)를 통해 변화한 전 세계 업무 동향과 채용 방식에 대한 주요 인사이트를 공개했다. 2024년에 접어들면서 업무에 AI를 활용하는 조직이 급격히 증가하고 있다. 이에 마이크로소프트는 ‘업무동향지표 2024’를 통해 AI가 업무와 노동 시장 전반에 미치는 영향에 대한 포괄적인 시각을 담은 세 가지 주요 트렌드를 공개했다. 한국을 포함한 전 세계 31개국 3만 1000명이 설문조사에 참여했으며, 마이크로소프트 365에서 수집된 수 조개의 생산성 신호, 링크드인의 노동 및 채용 트렌드, 포춘 500대 기업과의 협업을 통해 진행된 연구 결과가 반영됐다. 보고서에 따르면 전체 근로자 4명 중 3명이 직장에서 AI를 활용하고 있는 것으로 조사됐다. 근로자 75%(한국 73%)가 AI를 사용하고 있으며, 6개월 전부터 AI를 사용한 비율은 46% 증가했다. 리더의 79%가(한국 80%) AI 도입이 경쟁력 유지에 필수적이라고 인식하고 있으나, 이들 중 60%는(한국 68%) 조직 내 비전과 명확한 계획이 부족한 것에 대해 우려하고 있다고 답했다. 또한 개인화된 AI 솔루션을 통해 업무 효율성을 높이고 있는 경우가 많은 것으로 나타났다. 이 같은 경향은 BYOAI(Bring Your Own AI)라고 불리며, 조직에서 사용자가 자신의 AI 도구를 개인적으로 사용하는 트렌드를 말한다. 실제로 근로자 78%(한국 85%)는 응답자는 회사의 지원 없이 AI를 개인적으로 업무에 활용하고 있다고 답했다.     AI의 도입이 빠르게 이뤄지면서 대부분의 기업들은 인재를 확보하는 데에 어려움을 겪고 있는 것으로 조사됐다. 특히 이 같은 문제는 사이버 보안, 엔지니어링, 크리에이티브 디자인 직무에서 심화되고 있다. 먼저 채용 이유에 대한 우선순위가 달라졌다. 리더 중 과반수 이상(55%)이 인재 확보에 대해 우려하고 있으며, 66%(한국 70%)는 AI 기술을 보유하지 않은 지원자를 채용하지 않겠다고 답했다. 실제로 2023년 링크드인 프로필에 AI 관련 기술을 추가한 회원 수는 전년 대비 142배나 늘었으며, AI 관련 키워드가 언급된 공고의 지원자 수는 평균 17% 증가했다. 리더 응답자의 71%는 경력 유무보다 AI 역량을 갖춘 지원자를 선호한다고 응답했다. 한국 리더들도 77%의 높은 비중으로 AI 역량을 채용 우선순위로 두고 있다. 이번 연구에서는 AI 사용량이 적은 회의론자부터 사용 빈도가 높은 파워 유저, 초보자와 탐색자까지 네 가지 유형으로 표본 집단을 분류했다. 특히 파워 유저는 AI를 통해 업무 시간을 절약하는 등 비즈니스 프로세스와 방향을 재설정하고 있는 것으로 확인됐다. 이들 중 90% 이상이 AI 기술로 업무량을 더 수월하게 관리하고 있다. 특히 85%(한국 83%)는 AI로 하루를 시작하고 있으며, 다음날의 업무를 준비하는 데 AI를 활용하고 있다는 응답도 85%(한국 81%)에 달했다. CEO로부터 AI의 중요성에 대해 들은 경험이 있다는 응답은 61%(한국 42%)로 나타났다.  동료와 프롬프트에 대해 더 자주 소통하는 비율도 평균 대비 40%(한국 23%) 높게 나타났다. AI 사용 방법을 자주 실험할 가능성이 68%(한국 68%) 더 높은 편이며, 직무에 특화된 AI 교육을 받을 가능성도 35%(한국 30%) 높은 것으로 조사됐다. 보고서는 2024년이 AI가 직장에서 현실화되는 해가 될 것으로 내다보고 있다. 마이크로소프트는 보고서를 통해 조직이 단순한 업무 개선을 넘어, 비즈니스 모델 전반의 긍정적인 변화를 만들기 위해서는 AI를 활용해 성장을 가속화하고 비용을 관리하며, 고객에게 더 큰 가치를 제공할 수 있어야 한다고 제언했다.   마이크로소프트는 리더들에게 주어진 기회가 직원들의 AI에 대한 관심을 실질적인 비즈니스 성과로 연결할 수 있다고 강조했다. 이를 위해 ▲조직 내 비즈니스 해결을 위한 AI 도입 ▲톱다운(Top-down), 바텀업(Bottom-up) 접근법을 통한 모든 직원의 커뮤니케이션 협력 강화 ▲맞춤형 교육 제공을 통한 AI 기술 습득 등 AI 시대 혁신을 위한 세 가지 주요 전략도 소개했다.  한국마이크로소프트의 조원우 대표는 “생성형 AI가 등장하면서 스마트폰 이후 처음으로 기술과 사람이 상호 작용하는 방식이 근본적으로 바뀌기 시작했다”면서, “이번 보고서에서 눈여겨볼 만한 점은 AI가 적합한 인재 채용을 희망하는 리더와 경력 전환을 희망하는 직원에게 큰 기회를 제공할 것이라는 점”이라며 “AI 기술 도입에 따른 일자리 시장의 긍정적인 변화를 기대한다”고 전했다.
작성일 : 2024-05-14
어도비, AI로 개인화된 고객 여정 제공 지원 강화
어도비가 어도비 익스피리언스 클라우드(Adobe Experience Cloud)의 새로운 혁신을 발표하며, 브랜드가 효과적인 크로스채널 여정 조율을 통해 고객 참여를 강화하도록 지원한다고 밝혔다. 이번에 새롭게 발표된 통합 실험(unified experimentation) 역량은 브랜드가 고객 경로를 정확히 예측하도록 테스트 규모를 늘려 여러 채널에서 고객 전환율을 극대화하고, 고객 제안 콘텐츠를 여러 번 재사용할 수 있도록 돕는다. 또한 어도비 저니 옵티마이저(Adobe Journey Optimizer)에는 B2C 및 B2B 브랜드가 적절한 시기에 개인화된 경험을 통해 고객 여정을 조율할 수 있는 기능이 추가됐다. 마케터, 제품 관리자 및 개발자는 한층 강화된 통계 모델을 사용하는 통합 실험 및 목표 기반 최적화 서비스를 통해 고객 여정에 통합된 의사결정 역량을 활용하고, 소통 채널 전반에서 고객 제안 콘텐츠의 재사용을 유도하거나 전환율을 최대로 이끌어내기 위한 최적의 고객 경로를 제시할 수 있다. 브랜드는 콘텐츠 최적화, 여정 충돌 및 제안 수락 지연 등의 문제 해결을 중앙에서 관리하면서 콘텐츠, 채널, 타깃, 여정 및 머신 러닝 모델 전반에서 실험과 의사결정을 단계적으로 수행할 수 있다. 어도비 익스피리언스 플랫폼 기반의 어도비 저니 옵티마이저 B2B 에디션(Adobe Journey Optimizer B2B Edition)은 기업 고객별 구매 그룹 여정에 초점을 맞춘 엔터프라이즈 애플리케이션이다. 해당 제품은 마케팅 및 세일즈 팀 간의 협업을 통해 개인화된 B2B 구매 경험을 제공하고, 수요를 정확히 예측할 수 있도록 지원한다. 또한 익스피리언스 플랫폼의 통합 데이터와 생성형 AI를 활용해 여정을 개인화하고 어도비 마케토 인게이지(Adobe Marketo Engage)의 리드 마케팅 워크플로를 보완하며 포괄적인 B2B 서비스도 제공한다. 이 밖에도 브랜드는 저니 옵티마이저의 강화된 ‘브랜드 주도 여정 조율’ 기능으로 타깃 중심 캠페인을 실시간 고객 반응과 연결해 정확한 타깃의 참여를 유도할 수 있고, 모바일 및 웹 채널 지원 강화로 푸시, 인앱(in-app), 코드 기반 경험, 메시지 피드 등을 포괄적으로 이용 가능하다. 어도비의 아미트 아후자(Amit Ahuja) 디지털 경험 사업 부문 수석 부사장은 “어도비 익스피리언스 클라우드는 고객과 소통하는데 어려움을 겪고 있는 B2C 및 B2B 브랜드의 요구를 충족시킬 수 있는 솔루션을 제공한다”면서, “브랜드는 어도비 익스피리언스 플랫폼(Adobe Experience Platform)을 통해 서로 다른 데이터를 통합하고 고객에 대한 포괄적인 시각을 확보해, 각 고객에게 진정한 일대일 개인화를 제공하고 타깃 기업 고객 내 특정 구매 그룹의 참여를 유도할 수 있다”고 말했다.
작성일 : 2024-05-13
레노버, 하이브리드 AI 혁신 돕는 AMD 기반 서버 및 인프라 솔루션 공개
레노버는 에지부터 클라우드까지 하이브리드 AI 혁신을 지원하기 위해 새로운 맞춤형 AI 인프라 시스템 및 솔루션 제품군을 발표했다. 레노버는 다양한 환경과 산업에서 컴퓨팅 집약적인 워크로드를 처리하기 위해 폭넓은 GPU 옵션과 높은 냉각 효율성을 지닌 솔루션을 선보인다.    ▲ 씽크시스템 SR685a V3 GPU 서버   레노버는 AMD와 협력하여 씽크시스템(ThinkSystem) SR685a V3 GPU 서버를 선보였다. 이 서버는 고객에게 생성형 AI 및 대규모 언어 모델(LLM)을 포함해 컴퓨팅 수요가 많은 AI 워크로드를 처리하는데 적합한 성능을 제공한다. 또, 금융 서비스, 의료, 에너지, 기후 과학 및 운송 업계 내 대규모 데이터 세트를 처리하기 위한 빠른 가속, 대용량 메모리 및 I/O 대역폭을 제공한다. 새로운 씽크시스템 SR685a V3은 엔터프라이즈 프라이빗 온프레미스 AI와 퍼블릭 AI 클라우드 서비스 제공자 모두에게 최적화된 솔루션이다. 씽크시스템 SR685a V3는 금융 서비스 분야에서 사기 탐지 및 예방, 고객확인정책(KYC) 이니셔티브, 리스크 관리, 신용 발행, 자산 관리, 규제 준수 및 예측을 지원하도록 설계되었다. 4세대 AMD 에픽(EPYC) 프로세서와 AMD 인스팅트 MI300X GPU을 탑재하고 있으며, AMD 인피니티 패브릭으로 상호연결되어 1.5TB의 고대역폭(HBM3) 메모리, 최대 총 1TB/s의 GPU I/O 대역폭 성능을 제공한다. 공기 냉각 기술로 최대 성능을 유지하고 엔비디아의 HGXTM GPU와 향후 AMD CPU 업그레이드를 지원하는 등 유연성도 높였다. 레노버는 AMD EPYC 8004 프로세서를 탑재한 새로운 레노버 씽크애자일(ThinkAgile) MX455 V3 에지 프리미어 솔루션으로 에지에서 AI 추론 및 실시간 데이터 분석을 제공한다. 이번 다목적 AI 최적화 플랫폼은 에지에서 새로운 수준의 AI, 컴퓨팅 및 스토리지 성능을 제공하며, 높은 전력 효율성을 제공한다. 온프레미스 및 애저 클라우드와의 원활한 통합을 지원하며, 고객이 간소화된 라이프사이클 관리를 통해 총소유비용(TCO)을 절감하고 향상된 고객 경험을 얻으며 소프트웨어 혁신을 보다 빠르게 채택하도록 돕는다. 리테일, 제조 및 의료 분야에 최적화된 해당 솔루션은 낮은 관리 오버헤드, 레노버 오픈 클라우드 자동화(LOC-A) 툴을 통한 신속한 배포, 애저 아크(Azure Arc) 지원 아키텍처을 통한 클라우드 기반 매니지먼트, 마이크로소프트와 레노버가 검증한 지속적인 테스트와 자동화된 소프트웨어 업데이트를 통한 보안, 신뢰성 향상 및 다운타임 절감 등을 주요 특징으로 한다.   ▲ 씽크시스템 SD535 V3 서버   레노버와 AMD는 열효율성이 뛰어난 다중 노드의 고성능 레노버 씽크시스템 SD535 V3 서버도 공개했다. 이 제품은 단일 4세대 AMD 에픽 프로세서로 구동되는 1S/1U 절반 너비 서버 노드로 집약적인 트랜잭션 처리를 위해 랙당 퍼포먼스를 극대화시켰다. 이는 모든 규모의 기업을 위한 클라우드 컴퓨팅, 대규모 가상화, 빅 데이터 분석, 고성능 컴퓨팅 및 실시간 전자 상거래 트랜잭션을 포함해 워크로드에 대한 처리 능력과 열 효율성을 극대화한다. 한편, 레노버는 기업이 AI 도입으로 역량을 강화하고 성공을 가속화할 수 있도록 레노버 AI 자문 및 프로페셔널 서비스를 발표했다. 이 서비스는 모든 규모의 기업이 AI 환경에서 효율적인 비용으로 신속하게 알맞는 솔루션을 도입하고 AI를 구현할 수 있도록 다양한 서비스, 솔루션 및 플랫폼을 제공한다. 이 과정은 5단계, ‘AI 발견, AI 자문, AI의 빠른시작, AI 배포 및 확장, AI 관리’로 정리할 수 있다. 레노버는 먼저 보안, 인력, 기술 및 프로세스 전반에 걸쳐 조직의 AI 준비도를 평가하고, 이를 기반으로 조직의 목표에 맞는 가장 효과적인 AI 채택 및 관리 계획을 제안한다. 그런 다음, 레노버 전문가들은 이에 필요한 AI 요소를 설계 및 구축하고, AI 구현을 위한 도구 및 프레임워크를 배포하며, AI 시스템을 유지, 관리 및 최적화할 수 있는 지침을 제공한다. 마지막으로 레노버는 고객과 협력하여 배포부터 시작해 IT 제품 라이프사이클 전반을 지원하고, AI 사용 사례와 AI 성숙도가 함께 성장할 수 있도록 AI 이노베이터 생태계를 지속적으로 관리 및 발전시키고 있다.  레노버 AI 자문 및 프로페셔널 서비스를 통해 고객은 전문적인 IT 팀의 지원을 받아 AI 구현의 복잡성은 완화하고 실질적인 비즈니스 성과를 빠르게 낼수 있다. 레노버는 엔드 투 엔드 서비스, 하드웨어, AI 애플리케이션 및 서비스를 총동원해 고객이 AI 여정의 모든 단계에서 성장하도록 돕는다. 이는 결국 AI 도입을 간소화하여 모든 규모의 조직을 대상으로 AI 접근성을 높이고 산업 전반에 걸쳐 혁신적인 인텔리전스를 구현할 수 있도록 지원한다.  금융 서비스나 의료 업계 분야의 고객은 대량의 데이터 세트를 관리해야 하며 이는 높은 I/O 대역폭을 필요로 하는데, 레노버의 이번 신제품은 중요한 데이터 관리에 필수인 IT 인프라 솔루션에 초점을 맞추었다. 레노버 트루스케일 (Lenovo TruScale)은 고객이 까다로운 AI 워크로드를 서비스형 모델로 원활하게 통합할 수 있도록 유연성과 확장성을 지원한다. 또, 레노버 프로페셔널 서비스(Lenovo Professional Services)는 고객이 AI 환경에 쉽게 적응하고, AI 중심 기업들이 끊임없이 진화하는 요구사항과 기회를 충족할 수 있도록 돕는다. 레노버의 수미르 바티아(Sumir Bhatia) 아시아태평양 사장은 “레노버는 AMD와 함께 획기적인 MI300X 8-GPU 서버를 출시하며 AI 혁신에 앞장섰다. 레노버는 대규모 생성형 AI 및 LLM 워크로드를 처리할 수 있는 고성능을 제공함으로써 AI의 진화를 포용할 뿐만 아니라 더욱 전진시키고 있다. AMD의 최첨단 기술을 기반에 둔 우리의 최신 제품은 시장을 선도하겠다는 포부를 담고 있다. CIO의 AI 투자가 45% 증가할 것으로 예상됨에 따라, AMD MI300X 기반 솔루션의 포괄적인 제품군은 조직의 지능적인 혁신 여정에 힘을 실어줄 것”이라고 말했다.  레노버 글로벌 테크놀로지 코리아 윤석준 부사장은 “레노버는 하이브리드 AI 솔루션을 통해 국내에 다양한 기업을 지원하며 AI 혁신에 앞장서고 있다. 올해 한국 기업의 95% 이상이 생성형 AI에 투자할 계획을 갖고 있는 가운데, AI 도입이 증가하고 있다는 사실은 분명하다. 우리는 AI가 경쟁 우위를 확보하는 데 중추적인 역할을 한다는 점을 인지하고 AMD와 협력하여 포괄적인 AI 시스템 및 솔루션 제품군을 출시했다. 레노버는 금융 서비스 분야의 통찰력 가속화부터 의료산업 내 성능 강화까지 혁신적인 인텔리전스 분야를 선도하고 있다. AMD 기술로 구동되는 신규 씽크시스템 및 씽크애자일 제품은 에지 및 클라우드 환경 전반에 걸쳐 전례 없는 성능과 효율성을 제공하며 AI 배포를 혁신한다”고 전했다.
작성일 : 2024-05-08
[주영섭 칼럼] CES 2024가 우리 제조업에 던진 시사점
주영섭 특임교수 / 서울대학교 공학전문대학원(前 중소기업청장)   매년 1월 초 미국 라스베이거스에서 열리는 CES(소비자전자쇼)는 미래 기술 트렌드를 제시하는 세계 최대 기술 전시회라는 면에서 그 중요성이 날로 커지고 있다. CES는 1967년 뉴욕에서 시작하여 초기에는 가전제품을 중심으로 열렸으나, 2000년대 들어 자동차 및 헬스케어 분야로 확대되고 최근 AI(인공지능), 5G/6G 통신, 로봇, 드론, 메타버스 등 디지털 기술을 물론 우주, 스마트 시티, 푸드테크, 블록체인 및 웹3.0 등 사실상 첨단기술 전 분야를 망라하고 있다. 세계가 디지털·그린·문명 대전환 시대를 맞이하고 과학기술이 국가와 기업의 명운을 좌우하는 기술패권 시대로 접어들면서 기술의 트렌드를 이해하고 기술 역량을 확보하는 것이 생존과 발전의 필수 요건이 되고 있다. CES가 기업인은 물론 정부 관계자들이 반드시 가봐야 하는 중요한 전시회가 되고 있는 이유다. 특히 작년부터 전 세계를 강타하고 있는 챗(Chat)GPT 등 생성형 AI가 CES 2024의 핵심 화두가 되면서 새해 세계인의 관심이 더욱 집중된 바 있다. 올해 CES 2024에는 153개국에서 4,300개사가 전시업체로 참여하여 작년 3,200개를 훨씬 상회하고 참관 인원도 13만 5천명으로 작년의 11만 5천명을 대폭 초과하는 성황을 이루었다. 국가별로 전시업체 수를 비교해 보면 1위는 주최국인 미국으로 1,201개, 2위는 중국으로 1,115개, 3위가 한국으로 784개다. 우리나라는 올해 작년의 598개 대비 대폭 증가한 역대 최다 전시업체 참여로 CES 주관기관이 올해 핵심 키워드가 ‘Korea’라며 향후 CES의 주도국으로 큰 기대감을 내비치고 있다. 과거 우리 기업의 CES 참가는 삼성, LG, 현대기아차 등 대기업 중심으로 이루어졌으나 최근 스타트업‧벤처 기업 참여의 증가세가 괄목할 만하다. 올해 600개사 참여로 역대 최다 기록이다. 전 세계 1,200개 스타트업 기업의 혁신 기술 경연장이 된 유레카관에 우리 스타트업 기업이 443개 참여하여 프랑스 180개, 일본 60개, 네덜란드 60개 등 다른 나라를 압도하였다. 향후 많은 개선의 여지는 있으나 우리 기업과 정부의 다년간의 스타트업 육성 및 글로벌화 의지에서 나온 고무적 성과다. CES를 주도하고 있는 첨단 기술분야가 사실상 제조업의 현재와 미래를 망라하고 있다. 전자·ICT, 반도체, 배터리, 모빌리티, 로봇, 바이오, 헬스케어, 우주항공 등이 모두 첨단 제조업이다. 구조적으로 수출 등 해외의존도가 높은 우리 경제에서 제조업의 중요성이 절대적인 만큼 CES의 중요성도 대단히 중요하다. 이러한 맥락에서 CES에서 우리 대기업 및 스타트업‧벤처 기업의 존재감과 활약의 대폭 확대는 중장기적으로 큰 전략적 의미를 가지고 있다고 하겠다.   CES 2024  전시회    CES 2024가 제시한 기술 트렌드 및 패러다임 혁신은 우리 기업에 많은 시사점을 던지고 있다. 먼저 ‘기술 중심’에서 ‘기술의 목적(Purpose) 중심’으로 패러다임이 전환되고 있음을 주목해야 한다. 즉, 기술을 위한 기술 혁신이 아니라 인류를 위한 기술 혁신이어야 한다는 목적 중심으로의 관점 전환이 중요하다. CES는 작년부터 ‘모두를 위한 인류 안보 (Human Security for All)’라는 핵심 슬로건을 제시하며 세계가 모두 함께 기술 혁신으로 인류의 문제를 해결하자고 역설했다. 환경, 식량, 의료, 경제, 개인 안전 및 이동, 공동체 안전, 정치적 자유의 7개 분야에 올해 AI 등 기술이 추가된 8개 분야에서 인류가 당면하고 있는 큰 위험으로부터 인류를 구해내기 위해서는 새로운 기술혁신이 필요하다는 것이다. 우리 제조업의 당면과제인 ‘빠른 추격자(Fast Follower)’에서 ‘선도자(First Mover)’로의 전환에 성공하려면 세계인에 새로운 시대정신 기반의 ‘인류를 위한 기술 혁신’을 제시할 수 있어야 한다. CES의 핵심 슬로건인 ‘모두를 위한 인류 안보’는 우리 제조업의 기술 혁신이 지향할 목적으로 의미가 크다. 다음으로 CES 2024의 핵심 키워드인 ‘AI 전환(AX)’과 ‘지속가능성’에 주목해야 한다. AX는 디지털 전환(DX)의 핵심으로 기존의 분류형·예측형 AI에 생성형 AI가 가세함으로써 모든 산업 및 기업에 AX는 필수적 기본이 되고 있다. AX는 연결·데이터·AI가 3대 핵심요소인 DX의 핵심이지 별개가 아님은 두말할 여지가 없다. 우리 모든 기업, 기관 및 정부의 AX가 시급하다. 기업의 AX는 두 가지로 추진되어야 한다. 하나는 AI를 기반으로 개인화 및 맞춤화 등을 포함한 제품 및 서비스의 혁신이고, 또 하나는 AI를 통한 업무 및 작업의 생산성과 효율성의 획기적 제고다. 올해 AI 기반의 제품 혁신에서는 ‘온 디바이스(On-Device) AI’가 크게 부각되었다. 스마트폰, PC 및 노트북, 자동차, 로봇, 가전제품에 AI를 올리기 위한 ‘온 디바이스 AI’가 급속도로 확산될 전망이다. 이에 따라 AI 반도체, 센서, 클라우드 및 데이터 인프라, 디바이스 등 AI 생태계 구축이 국가적 과제가 되고 있다. 지속가능성’은 ‘환경’과 ‘사회’의 두 방향으로 추구되고 있다. ‘환경의 지속가능성’은 그린 대전환(GX)의 핵심이며 CES 2024에서는 탄소중립을 목표로 친환경 소재, 순환경제, 재생에너지 인프라, 수소, 핵융합 등 대체에너지가 큰 주목을 받았다. ‘사회의 지속가능성’은 ESG(환경·사회·지배구조)의 중요 축이며 사회 양극화, 젠더, 노소, 인종, 소외계층 등 사회문제 해결에 기여하는 포용적 기술 혁신이 크게 부상하였다. 이 역시 우리 제조업에의 시사점이 크다. 끝으로, 협력의 중요성이다. 속도가 너무 빠른 기술 혁신과 목적 중심의 패러다임 전환에 따라 협력 및 융합이 필수적으로 요구되고 있다. CES 2024에서도 이종 업종 간은 물론 동종 업종 내에서도 다양한 협력 사례가 제시되었다. AI 생태계 구축, 연결의 상호호환성 표준 등이 좋은 예다. 역시 우리 제조업계가 많은 노력을 해야 할 대목이다.  
작성일 : 2024-05-08
몽고DB, 생성형 AI로 최신 애플리케이션 구축 지원
몽고DB가 기업이 생성형 AI로 신속하게 최신 애플리케이션을 구축 및 배포하도록 지원하는 ‘몽고DB AI 애플리케이션 프로그램(MongoDB AI Applications Program : MAAP)’을 발표했다. 새롭게 선보인 MAAP은 기업 고객을 위한 몽고DB 및 파트너사의 전략적 자문과 전문 서비스를 비롯해 통합된 엔드투엔드 기술 스택을 제공한다. MAAP에는 컨설팅 및 파운데이션 모델(FM), 클라우드 인프라, 생성형 AI 프레임워크 및 모델 호스팅 제공기업 등이 초기 파트너로 참여해 몽고DB와 함께 고객이 고도화된 AI 기반 애플리케이션으로 비즈니스의 어려움을 해결하도록 지원할 방침이다. 이를 위해 MAAP은 생성형 AI를 빠르고 효율적으로 애플리케이션에 도입하길 원하는 기업을 위해 필요한 기술 스택과 전문성을 제공하는 원스톱 솔루션으로 설계됐다. 모든 기업은 생성형 AI가 주도한 혁신 속에서 경쟁 우위를 점하고 고객의 높아진 기대치를 뛰어넘기 위해 애플리케이션 현대화를 추진하고 있다. 전 산업군의 기업이 새로운 기술 변화의 이점을 누리기 위해 나서고 있지만, 새로운 종류의 애플리케이션을 안전하고 안정적으로 구축, 배포 및 확장하는 데 필요한 데이터 전략과 기술을 갖추지 못한 경우가 많다. 이들 중 상당수는 확장이 불가능한 레거시 기술로 인해 비효율적인 데이터 작업 방식을 고수하고 있으며, 일부는 불필요한 복잡성과 비용을 야기하는 단일 목적의 볼트온(bolt-on) 솔루션을 사용하고 있다. 이러한 경우, 기업은 기존의 기술과 애드온(add-on) 솔루션으로 인해 장기적인 성공보다는 PoC(Proof of Concept) 수준의 단기적인 결과에 머물게 된다. 몽고DB가 새롭게 선보인 MAAP은 기업이 가진 비즈니스 문제를 파악하고 역추적하며, 솔루션을 신속하게 구축 및 반복해 혁신적인 생성형 AI 애플리케이션 생산에 최적화된 전략적 프레임워크와 전문 서비스, 기술 로드맵을 제공한다. 몽고DB는 통합 개발자 데이터 플랫폼에서 기업이 생성형 AI 애플리케이션을 배포할 수 있는 기술을 MAAP에 접목했으며, 이와 함께 컨설팅 및 FM, 클라우드 인프라, 생성형 AI 프레임워크 및 모델 호스팅 제공 기업과의 파트너십을 기반으로 엔드 투 엔드 솔루션을 제공한다. 대표적으로 앤스로픽(Anthropic), 애니스케일(Anyscale), 아마존웹서비스(AWS), 코히어(Cohere), 크레달.ai(Credal.ai), 파이어웍스.ai(Fireworks.ai), 구글 클라우드(Google Cloud), 그래비티나인(gravity9), 랭체인(LangChain), 라마인덱스(LlamaIndex), 마이크로소프트 애저(Microsoft Azure), 노믹(Nomic), 피어아일랜드(PeerIslands), 퓨어인사이트(Pureinsights), 투게더 AI(Together AI) 등 기업이 MAAP의 초기 파트너사로 참여해 고객에게 필요한 기술, 풀 서비스 및 전문가 지원을 제공한다. MAAP은 기업에 대한 고도로 맞춤화된 분석에 기반한다. 먼저 몽고DB 프로페셔널 서비스(MongoDB Professional Services)는 조직의 현재 기술 스택을 평가하고 고객과 협력해 해결해야 할 비즈니스 문제를 파악한다. 이어 컨설팅 파트너와 함께 전략적 로드맵을 개발하고 프로토타입을 신속하게 마련해 결과물이 고객의 기대에 부합하는지 검증하며, 이를 실제 운영 환경에서 사용할 수 있도록 완전하게 구축된 애플리케이션을 최적화한다. 고객은 필요에 따라 새로운 생성형 AI 기능을 개발하기 위한 몽고DB 프로페셔널 서비스를 계속 지원받을 수 있다. 기업은 조직 전반과 고객을 위한 애플리케이션에 배포된 새로운 기술이 예상대로 작동하며 민감한 데이터를 노출하지 않는다는 확신을 가질 수 있어야 한다. MAAP의 파트너사는 안전성과 신뢰성, 유용성을 보장하도록 설계된 FM을 제공한다. 기업은 FM을 강력한 거버넌스 제어와 자체 데이터를 사용하는 검색 증강 생성(RAG) 등의 기술과 결합함으로써 FM이 제공하는 데이터를 정확히 제어하고 정확도 개선에 필요한 컨텍스트를 제공하며 환각현상(hallucination)을 줄일 수 있다. 또한 기업은 MAAP 파트너를 통해 도메인별 사용 사례에 최적화된 미세 조정 및 추론 서비스도 사용하며, 앤스로픽, 코히어, 메타(Meta), 미스트랄(Mistral), 오픈AI(OpenAI) 등 모델을 기반으로 빠른 AI 모델 응답 시간을 확보할 수 있다. 이처럼 MAAP은 사용 사례에 필요한 생성형 AI 참조 아키텍처, 통합 기술, 규정 등 실무 중심의 전문 서비스를 제공해 의도대로 작동하는 안전한 고성능 애플리케이션을 구축할 수 있다. MAAP은 생성형 AI를 대규모로 도입할 준비가 되지 않은 기업에게 안전한 비공개 샌드박스 환경에서 진행되는 맞춤형 프로토타입 세션을 제공한다. 예를 들어 전략, 운영, IT, 소프트웨어 개발 등 조직의 여러 부서가 전문가 세션에 참여해 다양한 의견을 모으고, 생성형 AI를 통해 해결할 수 있는 내부 비즈니스 과제를 파악하는 데 맞춤형 MAAP을 활용할 수 있다. 나아가 몽고DB 프로페셔널 서비스가 주도하는 해커톤을 통해 솔루션을 공동 구축하고 내부 사용 사례에 대한 효과를 테스트한다. 즉, MAAP은 생성형 AI가 특정 비즈니스 문제를 해결하는 실질적인 솔루션을 신속하게 구축하는 데 필요한 교육, 리소스 및 기술을 제공한다. 몽고DB의 앨런 차브라(Alan Chhabra) 월드와이드 파트너 부문 수석부사장은 “기민함이 필요한 스타트업부터 탄탄한 입지를 구축한 글로벌 기업까지 몽고DB의 다양한 고객이 생성형 AI에 많은 관심을 보이고 있다. 이들은 몽고DB의 최신 기술과 포괄적인 서비스를 활용해 혁신적인 아이디어를 실제 애플리케이션으로 전환하고 있으나 일부 기업은 여전히 비즈니스 문제 해결을 위해 생성형 AI를 통합할 최상의 방법을 고민하고 있다”고 전했다. 또한, “MAAP은 강력한 개발자 데이터 플랫폼인 몽고DB 아틀라스(MongoDB Atlas)와 몽고DB가 보유한 전문성 및 서비스, 그리고 생성형 AI 업계 리더들과의 전략적 파트너십을 통해 규모를 막론하고 모든 기업이 생성형 AI를 자신 있게 도입하고 구현할 수 있는 포괄적인 로드맵을 제공한다. 몽고DB와 파트너는 MAAP을 통해 고객의 생산성을 높이고 고객과의 상호 작용을 혁신하며 업계 발전을 주도하는 데 생성형 AI를 활용할 수 있도록 지원한다”고 말했다.
작성일 : 2024-05-07
IBM, 국내서도 AWS 마켓플레이스 소프트웨어 포트폴리오 확대
IBM은 한국을 포함한 전 세계 92개국에서 아마존웹서비스(AWS) 마켓플레이스를 통해 공급하는 자사 소프트웨어 포트폴리오를 확대한다고 발표했다. AWS 마켓플레이스는 AWS에서 가동되는 소프트웨어를 쉽게 찾고, 테스트, 구매, 배포할 수 있도록 독립 소프트웨어 벤더(ISV)의 수천 개 소프트웨어 목록을 제공하는 디지털 카탈로그다. 이미 IBM 소프트웨어가 제공되는 덴마크, 프랑스, 독일, 영국, 미국을 시작으로 서비스 국가가 확대되면서, 고객은 보다 간단한 구매 절차를 통해 AWS 약정 비용을 IBM 소프트웨어 구매에 사용해 효율을 높일 수 있다. 글로벌 시장조사기업 카날리스(Canalys)의 연구에 따르면 클라우드 마켓플레이스들은 지난 5년간 연평균 84% 성장률을 기록하며 450억 달러 규모로 성장할 것으로 예상돼 서비스형 소프트웨어(SaaS) 시장에서 가장 빠르게 발전하는 시장으로 부상했다. 마켓플레이스는 구매 주기 단축, 결제 통합, 소프트웨어 배포의 신속한 확장에 도움이 된다. 이번 발표를 통해 고객은 AWS 마켓플레이스에서 44개의 제품 라인업과 29개의 SaaS 제품 등 IBM의 인공지능(AI) 및 데이터 기술을 더 많이 이용할 수 있게 된다. 여기에는 기업이 AI 프로젝트를 구축, 확장 및 관리할 수 있도록 지원하는 왓슨x의 구성 요소가 포함되어 있다. 개방형 데이터 레이크하우스 구조에 구축된 맞춤형 데이터 저장소인 왓슨x.데이터와 AI 개발자를 위한 차세대 기업용 플랫폼인 왓슨x.ai를 이용할 수 있으며, IBM의 AI 어시스턴트인 왓슨x.어시스턴트와 왓슨x. 오케스트레이트도 이용할 수 있다. 왓슨x.거버넌스는 곧 출시될 예정이다. 다른 소프트웨어로는 IBM의 대표 데이터베이스인 데이터용 Db2 클라우드 팩과 앱티오(Apptio), 터보노믹(Turbonomic), 인스타나(Instana)를 포함한 자동화 소프트웨어 포트폴리오, IBM 보안 및 지속 가능성 소프트웨어 포트폴리오가 있다. 모두 AWS 기반의 레드햇 오픈시프트 서비스를 기반으로 구축되었다. 고객은 클라우드 중심 소프트웨어(cloud-native)를 통해 AWS에 소프트웨어를 배포할 수 있으며, SaaS 및 구독을 포함한 유연한 라이선싱을 통해 고객이 원하는 방식으로 쉽게 구매할 수 있다. 또한, IBM은 AWS 마켓플레이스에서 AWS 전용으로 설계된 15개의 새로운 IBM 컨설팅 전문 서비스 및 자산을 출시한다. 고객의 요구와 수요에 맞춰 데이터 및 애플리케이션 현대화, 보안 서비스, 맞춤형 산업별 솔루션에 중점을 두고 있으며, 일부 서비스에는 생성형 AI 기능이 포함된다. 또한 IBM 컨설팅은 2만 4000개의 AWS 인증과 최신 AWS 기술 전문가로 구성된 전담 팀을 통해 업계 모범 사례에 기반한 맞춤형 추천으로 고객을 지원할 예정이다. AWS의 매트 얀치신(Matt Yanchyshyn) AWS 마켓플레이스 및 파트너 서비스 총괄 매니저는 “IBM의 글로벌 확장은 양사의 전 세계 고객들에게 혁신의 기회를 열어줄 것”이라면서, “이제 고객들은 AWS 마켓플레이스의 속도와 간소화된 절차를 활용해 IBM의 최첨단 솔루션에 보다 쉽게 접근함으로써 디지털 혁신을 가속화하고 대규모 혁신을 추진할 수 있다. AWS와 IBM의 이번 협력 확대는 오늘날의 급변하는 환경에서 고객이 성공하는 데 필요한 도구와 리소스를 제공하려는 양사 공동의 노력이 반영된 것”이라고 말했다. IBM의 닉 오토(Nick Otto) 글로벌 전략적 파트너십 총괄은 “AWS 마켓플레이스에서 IBM 소프트웨어 포트폴리오의 가용성을 확대해 전 세계 기업들이 비즈니스 발전에 도움이 되는 다양한 IBM AI 및 하이브리드 클라우드 제품을 보다 간소화된 방식으로 활용할 수 있게 될 것”이라며, “AWS와의 협력은 고객의 요구를 충족하기 위해 다른 기업과 협력하여 고객이 IBM과 최대한 쉽게 비즈니스를 진행하고 혁신을 가속화하는 방법을 보여주는 대표적인 예”라고 말했다.
작성일 : 2024-05-03
어도비, 파이어플라이 AI를 적용한 어도비 익스프레스 모바일 앱 출시
어도비가 어도비 익스프레스(Adobe Express) 모바일 애플리케이션을 공식 출시했다.  어도비 익스프레스는 쉽고 빠르게 소셜 미디어 콘텐츠, 동영상, 전단지, 로고 등을 구상 및 디자인하며 공유할 수 있는 올인원 AI 콘텐츠 제작 앱이다. 어도비는 “어도비 익스프레스로 제작된 콘텐츠 수가 지난해에만 두 배 이상 증가하는 등 전 세계 수백만 명의 사용자가 콘텐츠 제작을 위해 어도비 익스프레스를 사용하고 있다”고 설명했다.  새로운 어도비 익스프레스 모바일 앱은 무료로 사용 가능하며 다양한 언어와 대부분의 안드로이드 및 iOS 기기를 지원한다. 사진, 디자인, 동영상 및 생성형 AI 역량 등을 올인원 콘텐츠 편집기에 통합해 마케터, 중소기업, 학생, 크리에이터 전문가 등 누구나 웹과 모바일에서 고품질의 콘텐츠를 제작할 수 있도록 돕는 것이 특징이다. 또한, 어도비 익스프레스는 모든 스킬 수준의 사용자가 어도비 파이어플라이 생성형 AI 구동 기능을 통해 빠르고 간편하게 복잡한 작업을 해결할 수 있도록 지원한다. 크리에이터는 텍스트를 이미지로(Text to Image), 텍스트 효과(Text Effects), 생성형 채우기(Generative Fill), 텍스트를 템플릿으로(Text to Template) 등의 기능을 사용해 간단한 텍스트 프롬프트로 뛰어난 이미지와 디자인을 즉시 생성하고, 인물이나 개체를 삽입, 제거 및 교체하며 시선을 사로잡는 헤드라인을 만들 수 있다. 또한 오디오에서 애니메이션(Animate from Audio)과 비디오 자막(Caption Videos) 등 AI 기능을 통해 복잡한 작업을 클릭 한 번으로 자동화할 수 있다.     새로운 어도비 익스프레스 모바일 앱은 어디서나 쉽고 빠르게 아이디어를 구상하고, 콘텐츠를 생성 및 게시할 수 있도록 다양한 기능을 제공한다. 템플릿에 동영상 클립과 이미지, 음악을 결합할 수 있으며, 애니메이션을 추가하고 정확한 맞춤형 자막을 100개 이상의 언어로 실시간 생성 및 편집할 수 있다. 동영상 타임라인, 레이어 타이밍 및 4K 동영상 기능도 지원한다. 클릭 한 번으로 이미지 및 동영상 배경을 편집, 제거하거나 크기를 조정하고, QR 코드를 생성하거나 동영상을 자를 수 있다. 텍스트를 이미지로 생성할 수 있고, 간단한 텍스트 프롬프트로 인물, 개체 등을 삽입, 제거 및 교체할 수도 있다. 생성형 AI를 활용해 헤드라인, 카피 및 메세지를 만들거나 소셜 미디어 콘텐츠, 전단지, 포스터용 템플릿을 제작할 수도 있다. 사용자는 수천 개의 동영상 및 템플릿과 2만 8000개 이상의 어도비 글꼴, 수십만 개의 어도비 스톡 동영상, 음악 및 디자인 애셋을 이용할 수 있다.
작성일 : 2024-05-03
오픈AI CLIP 모델의 이해/코드 분석/개발/사용
BIM 칼럼니스트 강태욱의 이슈 & 토크   이번 호에서는 생성형 AI의 멀티모달 딥러닝 기술 확산의 계기가 된 오픈AI(OpenAI)의 CLIP(Contrastive Language-Image Pre-Training, 2021) 코드 개발 과정을 분석하고, 사용하는 방법을 정리한다.    ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 이메일 | laputa99999@gmail.com 페이스북 | www.facebook.com/laputa999 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | http://www.facebook.com/groups/digestpodcast CLIP은 구글이 개발한 자연어 번역 목적의 트랜스포머 모델, 비전 데이터 변환에 사용되는 VAE(Variational Autoencoder) 개념을 사용하여 멀티모달 학습 방식을 구현하였다. 이번 호에서는 그 과정을 설명하고 파이토치로 직접 구현하는 과정을 보여준다. CLIP을 이용하면 유튜브, 넷플릭스와 같은 영상에서 자연어로 질의해 해당 장면을 효과적으로 검색할 수 있다. 참고로, CLIP에서는 트랜스포머가 핵심 컴포넌트로 사용되었다. CLIP과 같이 트랜스포머가 자연어 번역 이외에 멀티모달의 핵심 기술이 된 이유는 비정형 데이터를 연산 가능한 차원으로 수치화할 수 있는 임베딩 기술의 발전과 트랜스포머의 Key, Query, Value 입력을 통한 여러 학습 데이터 조합이 가능한 특징이 크게 작용했다.    그림 1. 멀티모달 시작을 알린 오픈AI의 CLIP 모델(Learning Transferable Visual Models From Natural Language Supervision, 2021)   트랜스포머와 VAE를 이용한 멀티모달 CLIP 네트워크를 좀 더 깊게 파헤쳐 보도록 한다. 앞서 설명된 트랜스포머, 임베딩과 관련된 개념에 익숙하다면, CLIP을 이해하고 구현하는 것이 그리 어렵지는 않을 것이다.    CLIP에 대한 이해 오픈AI에서 개발한 CLIP 모델은 공유 임베딩 공간 내에서 이미지 및 텍스트 형식을 통합하는 것을 목표로 했다. 이 개념은 기술과 함께 이미지와 텍스트를 넘어 다른 양식을 수용한다.(멀티모달) 예를 들어, 유튜브 등 비디오 애플리케이션 내에서 텍스트 검색 성능을 개선하기 위해 공통 임베딩 공간에서 비디오 및 텍스트 형식을 결합하여 모델을 학습시켰다. 사실, 임베딩 텐서를 잠재 공간(Latent Space)으로 이기종 데이터를 변환, 계산, 역변환할 수 있다는 아이디어는 VAE 기술, 구글의 트랜스포머 논문(2017)을 통해 개발자들 사이에 암시되어 있었다. 이를 실제로 시도해본 연구가 CLIP이다.  참고로, CLAP(Contrastive Language-Audio Pretraining)은 동일한 임베딩 공간 내에서 텍스트와 오디오 형식을 통합하는 또 다른 모델로, 오디오 애플리케이션 내에서 검색 기능을 개선하는 데 유용하다. CLIP은 다음과 같은 응용에 유용하다. 이미지 분류 및 검색 : CLIP은 이미지를 자연어 설명과 연결하여 이미지 분류 작업에 사용할 수 있다. 사용자가 텍스트 쿼리를 사용하여 이미지를 검색할 수 있는 보다 다양하고 유연한 이미지 검색 시스템을 허용한다. 콘텐츠 조정 : CLIP은 부적절하거나 유해한 콘텐츠를 식별하고 필터링하기 위해 이미지와 함께 제공되는 텍스트를 분석하여, 온라인 플랫폼의 콘텐츠를 조정하는 데 사용할 수 있다. 참고로, 메타 AI(Meta AI)는 최근 이미지, 텍스트, 오디오, 깊이, 열, IMU 데이터 등 6가지 양식에 걸쳐 공동 임베딩을 학습하는 이미지바인드(ImageBind)를 출시했다. 두 가지 모달리티를 수용하는 최초의 대규모 AI 모델인 CLIP은 이미지바인드 및 기타 다중 모달리티 AI 시스템을 이해하기 위한 전제 조건이다. CLIP은 배치 내에서 어떤 N×N(이미지, 텍스트) 쌍이 실제 일치하는지 예측하도록 설계되었다. CLIP은 이미지 인코더와 텍스트 인코더의 공동 학습을 통해 멀티모달 임베딩 공간을 만든다. CLIP 손실은 트랜스포머의 어텐션 모델을 사용하여, 학습 데이터 배치에서 N개 쌍에 대한 이미지와 텍스트 임베딩 간의 코사인 유사성을 최대화하는 것을 목표로 한다.  다음은 이를 설명하는 의사코드이다. 1. img_en = image_encoder(I)   # [n, d_i] 이미지 임베딩 인코딩을 통한 특징 추출  2. txtxt_emdn = textxt_emdncoder(T)    # [n, d_t] 텍스트 임베딩 인코딩을 통한 특징 추출 3. img_emd = l2_normalize(np.dot(img_en, W_i), axis=1)    # I×W 결합(조인트) 멀티모달 임베딩 텐서 계산 4. txt_emd = l2_normalize(np.dot(txtxt_emdn, W_t), axis=1)  # T×W 결합(조인트) 멀티모달 임베딩 텐서 계산 5. logits = np.dot(img_emd, txt_emd.T) * np.exp(t)   # I×T * E^t 함수를 이용한 [n, n]코사인 유사도 계산 6. labels = np.arange(n) 7. loss_i = cross_entropy_loss(logits, labels, axis=0)  # 이미지 참값 logits과 예측된 label간 손실 8. loss_t = cross_entropy_loss(logits, labels, axis=1)  # 텍스트 참값 logits과 예측된 label간 손실 9. loss = (loss_i + loss_t)/2   # 이미지, 텍스트 손실 평균값   실제 오픈AI 논문에는 <그림 2>와 같이 기술되어 있다.(동일하다.)   그림 2     ■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2024-05-02